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摘 要 : 


H 信息 推荐 
: P393.1 


[ 目的 /意义 ] Web 2.0 时 代 , 在 线 评论 质量 参差 不 齐 和 过 载 问题 十 分 严重 ,人 们 从 中 获取 有 价值 内 容 的 认 知 成 本 
越 来 越 高 。 探 完 以 信息 推荐 方式 解决 评论 过 载 的 有 效 方案 ,以 提升 网 络 信息 利用 率 和 信息 服务 质量 。 论 文 提出 
的 评论 排名 推荐 方案 关注 评论 的 信息 质量 ,更 强调 对 用 户 的 个 人 信息 需求 的 满足 。[ 方法/ 过程] 研究 运用 概率 主 
题 模型 ,引入 词 向 量 构建 主题 空间 下 的 用 户 模型 和 评论 模型 ,通过 将 其 纳入 评论 感知 效用 评测 系统 ,实现 融合 用 
户 兴趣 和 评论 质量 的 评论 推荐 ,推荐 效果 通过 系统 实验 予以 检测 。[ 结果 /结论 ] 实验 结果 表明 ,评论 信息 质量 和 
用 户 个 体 的 信息 需求 ,共同 作用 于 用 户 对 评论 感知 效用 的 满意 度 ; 推荐 策略 实现 了 二 者 的 有 机 融合 ,三 组 不 同 推 
荐 模式 下 的 评测 效果 显示 , 相 较 于 单纯 的 “兴趣 推荐 ”和 “效用 推荐 " “融合 推荐 "综合 满意 度 得 分 最 高 。 

评论 效用 预测 MPR 在 线 评论 

G202 


虑 中 。 个 性 化 的 信息 推荐 ,是 解决 信息 过 载 问题 的 重 
要 途径 。 本 文 关注 这 一 研究 议题 ,探究 将 用 户 的 个 人 


入 [移动 互联 时 代 , 网 上 分 享 观点 .发表 评论 成 为 人 们 
的 办 活 日 常 。 在 线 评论 提供 的 有 价值 内 容 , 能 帮助 人 


信息 需求 融入 评论 效用 预测 模型 的 有 效 方案 ,以 构建 
融合 个 人 兴趣 及 评论 质量 两 方面 要 素 的 个 性 化 评论 推 


们 溢 除 决策 过 程 中 的 不 确定 性 ,对 个 体 行为 产生 了 深 
远 影响 。 但 在 “人 人 都 是 创作 者 ”的 网 络 环境 中 ,在 线 
WA Wi ,质量 参差 不 齐 等 问题 变 得 日 益 严重 ,人 们 获 
取 容 价 值 内 容 的 认 知 成 本 越 来 越 高 。 为 减轻 用 户 认 知 
负 据 ,提升 信息 服务 品质 ,各 网 站 均 采取 了 信息 过 滤 机 
HO 淘宝 "以 是 否 有 图 ,是否 追 评 以 及 商品 评级 高 低 
等 作为 筛选 标准 ,大众 点 评 网 "根据 用 户 反 馈 屏 项 不 
可 信 内 容 ,“ 豆 辩 " 和 “亚马逊 "等 采用 用 户 投票 对 评论 
排序 。 这 些 过 滤 策 略 主要 针对 信息 质量 ,通过 将 高 质 
量 评论 置顶 来 帮助 用 户 快速 获取 有 用 信息 。 尽 管 如 
此 ,这 些 过 滤 策略 没有 关注 到 对 用 户 个 体 需求 的 满足 。 

个 体 对 信息 的 采纳 , 除 受信 息 质量 的 影响 ,与 个 体 
信息 需求 有 关 , 人 们 会 更 在 意 接收 的 信息 中 是 否 有 其 
感 兴趣 的 内 容 。 特 别 是 在 信息 量 超出 人 认 知 负荷 的 情 
况 下 ,人 们 快速 浏览 ,希望 尽快 找到 自己 关注 的 内 容 。 
因此 ,以 减轻 用 户 认 知 负担 ,提升 信息 检索 质量 为 目标 
来 研究 信息 的 效用 价值 ,还 应 将 用 户 个 体 要 素 纳入 考 


lm 


穴 系 统 。 人 研究 从 推荐 的 视角 来 探讨 信息 服务 精准 化 的 
实践 策略 ,以 期 为 控制 评论 信息 泛滥 ,提升 信息 服务 质 
量 与 信息 利用 价值 的 实践 性 工作 提供 参考 。 


2 相关 研究 


2.1 基于 评论 效用 的 评论 排名 与 推荐 研究 

评论 排名 的 实质 是 对 评论 效用 进行 评价 ,基于 效 
评价 生成 TopN 推荐 列表 。 近 年 研究 中 , 郭 顺利 等 ” 
采用 模糊 层次 分 析 法 和 加 权 灰 色 关 联 分 析 法 预测 评论 
效用 , 据 之 对 评论 排名 ,并 选择 信息 量 大 的 评论 作 最 后 
推荐 。 张 艳 丰 等 ”运用 K-means 算法 对 评论 效用 进行 
等 级 划分 ,继而 对 评论 排序 做 优化 。 王 忠 群 等 中 基于 
评论 中 “特征 - 观点 ”对 的 数量 计算 评论 可 信和 度 对 其 
排序 ,再 以 问卷 方式 洲 请 用 户 对 TopN 评论 作 评 价 。 吴 
表 等 中 认为 撰写 人 的 历史 评论 可 反映 其 发 表 评 论 的 质 
量 ,他 们 基于 撰写 人 曾经 发 表 的 评论 对 其 建 模 ,并 融入 
评论 模型 ,研究 发 现 融 入 撰写 人 信息 的 模型 能 更 好 地 
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预测 评论 的 效用 。 可 见 , 评 论 的 排名 与 推荐 主要 根据 
评价 指标 的 计算 。 这 些 研究 中 ,评价 指标 关注 了 评论 
的 信息 量 、 内 容 , 可 信 度 ,撰写 人 水 平 ,阅读 群体 整体 感 
知 效用 等 一 系列 要 素 ,这 些 要 素 对 辨识 高 质量 评论 起 
着 至 关 重 要 的 作用 。 
但 最 新 的 一 份 研究 报告 却 指出 ,上 述评 价 指标 反 
映 的 只 是 评论 信息 在 数据 可 靠 性 方面 的 质量 ,没有 强 
调 评论 信息 对 目标 信息 用 户 的 适用 程度 "”。 研 究 者 认 
为 对 在 线 评论 感知 效用 的 评价 是 基于 用 户 视角 的 一 种 
信息 质量 评估 ,以 用 户 的 主观 认识 为 出 发 点 探讨 信息 
的 效用 , 需 个 体 根 据 其 个 人 经 验 对 信息 功能 绩效 进行 
系统 性 评估 。 因 此 ,网 络 环境 下 的 用 户 评论 既 要 成 为 
符合 标准 的 高 质量 信息 ,更 应 关注 评论 信息 对 用 户 需 
莫 和 期 望 的 满足 程度 及 为 用 户 带 来 的 价值 ”。 持 相同 
观 坦 的 研究 者 不 乏 其 人 , 李 健 等 四 探究 产品 推荐 ,他 们 
评论 的 效 价 应 将 消费 者 的 个 体 偏好 纳入 考虑 , 寻 
e 消费 者 个 人 偏好 匹配 的 高 质量 评论 。E. Ben-ab- 
dalah 等 中 分 析 不 同 网 络 平台 上 的 云 服务 评论 的 质量 ， 
通过 计算 评论 者 个 人 信息 与 云 服务 平台 信息 需求 者 的 
背 寺 信息 的 相似 性 ,来 实现 评论 推荐 。 这 些 研究 均 以 
化 的 视角 来 研究 评论 的 感知 价值 。 
20D 基于 评论 的 推荐 系统 研究 
2 名 MH。 基于 评论 的 推荐 系统 分 类 
全 推荐 是 解决 信息 过 载 的 有 效 方法 ,通过 探知 用 户 
泊 需 求 , 推 荐 系统 能 够 实现 面向 个 人 兴趣 的 信息 扒 
中 过 载 信 息 造 成 的 困扰 所。 产品 推荐 系统 的 核 


阵 ,提升 系统 性 能 。 双 .Zhang 等 ”针对 用 户 发 表 的 产 
品评 论 ,采用 情感 分 析 预 测 用 户 对 产品 的 评分 ,构建 基 
于 “预测 评分 ”的 用 户 模型 ,用 于 产品 推荐 。C. Musat 
等 通过 凝练 评论 中 斑 含 的 产品 主题 信息 对 用 户 评 
分 加 权 , 进 一 步 了 提升 了 模型 的 质量 。 张 宜 浩 等 "“ 提 
出 融合 用 户 评 分 ,情感 倾向 和 产品 内 容 的 混合 推荐 算 
法 ,通过 对 稀疏 的 “用 户 -评分 "矩阵 进行 填补 修正 ， 
对 产品 进行 排名 推荐 。 

特征 推荐 聚焦 评论 内 容 中 提 及 的 推荐 对 象 ( 产 
n) 的 细节 。 用 户 偏好 描述 直 指 产品 特征 ,是 基于 产品 
特征 评价 的 用 户 建 模 。H. Liu 等 ' 的 研究 中 ,用 户 兴 
趣 涉及 关注 度 和 需求 度 两 项 指标 ,关注 度 与 产品 特征 
提 及 率 有 关 ,需求 度 与 产品 评价 有 关 ,再 . Liu 等 从 评论 
文本 中 提取 产品 特征 词 和 评价 词 ,构建 了 特征 级 用 户 
兴趣 模型 ,获得 了 更 精准 的 产品 推荐 效果 。 张 严 亮 
等 “在 完善 用 户 建 模 的 研究 中 ,关注 用 户 兴 趣 的 变 
化 ,他 们 借助 用 户 发 表 的 评论 挖 气 用 户 对 产品 各 特征 
的 评价 , 且 定 期 更 新 评论 ,预测 用 户 兴 趣 及 变化 趋势 。 
基于 特征 的 推荐 同样 采用 协同 推荐 ,需要 对 评论 文本 
做 细 粒 度 分 析 。 
2.2.2 基于 评论 的 推荐 系统 建 模 方法 

产品 评论 已 成 为 推荐 系统 建 模 的 重要 数据 源 , 从 
评论 内 容 中 提取 用 户 关注 的 产品 特征 , 作 情 感 分 析 , 预 
测 用 户 对 产品 的 评分 是 相关 研究 均 涉及 的 问题 。 用 户 
模型 和 产品 模型 主要 采用 隐 性 特征 向 量 ,概率 主题 模 
型 和 深度 学 习 方法 被 广泛 用 于 建 模 。Y. Bao 等 利 


心 基 构 建 有 效 的 用 户 和 产品 模型 。 评 论 信息 因 富 含 用 
户 妓 产 品 的 评价 ,从 中 提炼 用 户 偏好 构建 用 户 模型 ,将 
其 引入 推荐 系统 成 为 近年 的 研究 热点 。L. Chen 等 ” 
从 用 户 建 模 的 视角 ,把 相关 研究 划分 为 词 项 推荐 ,评分 
推荐 和 特征 推荐 三 类 。 

基于 词 项 的 推荐 归属 内 容 推荐 ,直接 利用 评论 文 
本 对 用 户 和 产品 建 模 。 如 S. G. Esparza 4$ 从 用 户 发 
表 的 评论 中 提取 词 项 ,以 TF-IDF 为 词 项 权重 生成 用 户 
模型 ,产品 模型 则 基于 目标 产品 的 评论 集 , 最 后 依据 二 
者 内 容 相 似 度 进行 推荐 。 耿 立 校 等 的 文献 推荐 系 
统 基于 用 户 阅 读 过 的 文献 对 其 建 模 ,用 词 向 量 表征 词 
项 ,将 用 户 和 推荐 目标 (文献 ) 的 相似 度 计算 升 至 语义 
层面 。 

评分 推荐 采用 的 协同 推荐 机 制 需 要 生成 “用 户 - 
评分 "矩阵 ,但 矩阵 稀 琉 性 问题 一 直 是 协同 推荐 系统 性 
能 提升 的 瓶颈 。 解 决 方法 之 一 是 利用 评论 的 文本 数据 
预测 用 户 对 产品 的 评分 ,进而 完善 “用 户 - EA" HB 


j 非 负 和 矩阵 分 解 获 得 评论 文本 的 隐 主 题 ,以 主题 分 布 
反映 用 户 偏好 和 产品 特性 。S，Feng 等 提出 结合 概 
率 主题 和 随机 漫步 的 混合 建 模 思路 ,概率 模型 负责 挖 
掘 用户 潜在 偏好 和 产品 隐 特征 ,随机 漫步 用 于 构建 全 
局 的 潜在 关联 。 概 率 主 题 模 型 能 够 提取 文本 的 语义 特 
征 ,并 通过 降 维 缓解 稀 玻 高 维 矩 阵 产 生 的 问题 。 不 足 
之 处 是 忽略 了 重要 的 上 下 文 信息 。 

深度 学 习 模 型 能 有 效 保留 词 序 信息 ,更 好 地 提炼 
文本 特征 ,提升 建 模 质 量 。L. Zheng 等 ”提出 的 Deep- 
CoNN 模型 采用 两 个 并 行 的 卷 积 神经 网 络 模型 CNN 从 
评论 中 学 习 用 户 和 产品 的 隐 向 量 表示 ,以 评分 预测 函 
数 为 损失 函数 进行 迭代 训练 ,预测 用 户 对 产品 的 评分 ; 
S. Seo 等 "在 CNN 的 基础 上 ,进一步 引入 注意 力 机 制 
ATT 来 建 模 评论 中 的 不 同 部 分 与 用 户 偏好 和 产品 特征 
的 关联 度 , 优 化 模型 。C，Chen 等 "为 了 充分 利用 了 
评分 矩阵 中 用 户 及 产品 蕴含 的 信息 , 建 模 时 ,将 评论 文 
本 和 评分 矩阵 同时 引入 。 冯 兴 杰 等 ™ 借 鉴 C. Chen 的 


Si 


69 


&Q 44i xt 


$865 35 58 10 Hg. 2021 年 5 月 


ChinaXiv& fERBTIJ 


思路 ,将 静态 词 向 量 换 成 可 动态 微调 的 Bert 预 训 练 模 
,结合 双向 GRU 结构 和 ATT 机 制 分 别 从 用 户 评论 和 
产品 评论 中 提取 用 户 与 产品 的 深层 次 特征 向 量 , 进 一 
步 提升 推荐 算法 预测 的 准确 率 。 

综 上 ,推荐 系统 近年 研究 中 ,在 线 评论 作为 控 握 


型 


空间 下 ,通过 计算 同一 主题 空间 下 用 户 兴趣 与 评论 内 
容 的 语义 相关 度 评测 评论 效用 ,相关 度 反 映 了 评论 信 
息 与 用 户 兴趣 的 一 致 性 。 最 终 推 荐 策略 进一步 将 基于 
投票 机 制 获 得 的 评论 感知 效用 值 融 入 推荐 指标 计算 ， 
实现 兼 具 评 论 质量 的 个 性 化 评论 推荐 。 本 文 研究 将 手 
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户 兴趣 偏好 的 重要 信息 源 受到 重视 。 利 用 用 户 评论 
成 用 户 模型 ;或 通过 预测 用 户 对 产品 的 评分 来 提升 “ 
户 -评分 矩阵 质量 的 协同 推荐 策略 被 普遍 采纳 。 这 
些 通过 评论 文本 学 习 获得 的 用 户 和 产品 模型 均 以 隐 向 
量 形式 表征 ,概率 主题 模型 和 深度 学 习 算 法 被 广泛 用 
于 提升 建 模 质量 。 

3 研究 设计 

一 本 文 以 满足 用 户 个 性 化 信息 需求 为 出 发 点 ,提出 
融 容 用 户 兴趣 与 评论 信息 质量 的 排名 推荐 策略 ,探究 
尼 依 息 推荐 方式 解决 评论 信息 过 载 的 有 效 方法 。 研 究 
庆 努 评论 的 效用 在 于 为 用 户 决策 提供 参考 ,而 真正 意 
妈 B 的 决策 帮助 ,应 面向 用 户 的 个 人 需求 与 偏好 , 人们 
对 评论 的 感知 效用 因 个 体 不 同 产生 差异 ,评论 推荐 应 
SR 注 几 户 的 个 性 化 信息 需求 。 李 健 等 从 理论 层面 
j 通 一 问题 进行 了 深度 探讨 ; 祝 琳 琳 等 ”通过 问卷 获 
得 于 据 , 基 于 统计 分 析 方 法 进行 了 实证 性 研究 。E. 
Bbqallah 等 中 以 信息 需求 者 与 评论 撰写 人 的 相似 
性 模 为 信息 推荐 依据 ,但 没 对 目标 评论 进行 直接 分 析 。 


H | 


机 评论 作为 推荐 对 象 ,实验 重点 是 用 户 兴趣 建 模 和 评 
论 推 荐 策略 的 实施 与 评测 ,具体 涉及 3 个 问题 :四 如 何 
对 推荐 的 评论 及 用 户 兴趣 进行 有 效 建 模 ? @ 如 何 构建 
融入 用 户 兴趣 的 评论 感知 效用 预测 模型 ? C ar fa S A 
推荐 策略 的 效果 ,验证 推荐 方案 的 科学 性 与 合理 性 。 
针对 上 述 3 个 问题 ,整个 研究 分 为 5 个 模块 ,研究 
架构 如 图 1 所 示 。@ 数 据 预 处 理 。 对 评论 原始 语 料 进 
行 数 据 清 洗 和 预 处 理 操作 ,构建 评论 语料库 。@) 构 建 
评论 z 的 主题 模型 。 探 索 构 建 评论 模型 的 合理 方案 。 
引入 特征 词典 特征 同义词 典 , 采 用 主题 聚 类 生成 评论 
内 容 的 描述 框架 ,通过 挖掘 产品 关注 点 构建 主题 空间 
下 的 评论 模型 r. topic_profile。@ 构 建 用 户 u 的 兴趣 模 
型 。 基 于 主题 模型 描述 用 户 兴 趣 , 引 入 词 向 量 ,实现 从 
特征 词 序 列 的 用 户 模 型 u. feature_profile 到 主题 模型 
u. topic, profile 的 映射 。 电 推荐 预测 模型 构建 。 构 建 
融入 用 户 兴 趣 的 评论 感知 效用 预测 模型 ,设计 评论 排 
序 推 荐 策略 。 名 推荐 效果 评测 。 开 发 在 线 评 测 平 台 ， 
采用 “用 户 选 择 -评论 推送 - 用 户 反 馈 ” 的 交互 方式 
获取 用 户 对 各 推荐 方案 的 评分 , 验 测 个 性 化 评论 推荐 


术 美 则 运用 评论 挖掘 手段 ,通过 构建 个 性 化 的 评论 感 
知 线 用 评测 模型 ,来 实现 个 性 化 的 评论 信息 推荐 。 

-三 研究 选择 概率 主题 模型 凝聚 评论 文本 中 的 产品 特 
征 & 革 成 用 户 和 推荐 对 象 (评论 ) 的 特征 描述 框架 , 评 
论文 本 直接 用 隐 主 题 向 量 表征 ;用 户 兴 趣 模型 则 先 通 


策略 的 实际 效果 。 

5 个 模块 中 ,@)@) 分 别 对 应 评论 建 模 与 用 户 建 模 ， 
是 评论 个 性 化 推荐 系统 的 核心 部 分 ;@@ 将 用 户 要 素 
引入 评论 感知 效用 预测 模型 ,重点 探究 个 性 化 评论 排 
名 推荐 策略 及 实现 ,并 予以 验证 。 


过 交互 手段 获取 其 感 兴趣 的 特征 词 ,再 映射 至 隐 主 题 
特征 词典 
同 
特征 词 模型 义 
COR A AE S UT ES 同 义 符 征 词 标 化 模型 | |--| 全 
IRAR ee | 名 词 + 动词 模型 向 
数据 清洗 加 主题 模型 构建 
分 词 /分 句 / 词性 标注 | 
名 推荐 预测 模型 构建 GRIP Bn Heg 
回 评 测 实验 效用 建 模 方案 评论 模型 
评测 数据 采集 平台 又 趣 建 模 方 案 兴趣 引导 词 集 
评测 实验 ALEEA 户 特征 模型 " 
评测 数据 分 析 户主 题 模 型 | ME 


图 1 


融合 评论 效用 与 用 户 兴 趣 的 个 性 化 评论 排名 推荐 研究 架构 
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4 ”模型 与 方法 


4.1 rg 
4.1.1 LDA 隐 主 题 模型 

研究 的 首要 任务 是 在 同一 描述 框架 下 对 评论 和 用 
户 建 模 ,对 此 选择 了 LDA KETEN, LDA 是 一 个 多 
层 产生 式 概率 模型 ,分 词 项 .主题 ,文档 3 个 层次 。 模 
型 中 ,D(1D1 =N) HIME, WOW = M) HIR, pC 
el = 天) 表示 隐 主 题 。 文 档 de D 由 隐 主 题 随机 混合 生 
成 ,一 般 表示 成 WW 上 的 序列 模式 4 = ww e Wi ; 隐 
主题 p 则 是 柬 上 的 多 项 式 分 布 。 

o 和 B 是 LDA 模型 的 重要 参数 。a c xc PASE D 
中 隐 主 题 的 相对 强度 ,与 主题 的 先 验 概率 分 布 Dirichlet 
^3 B 刻画 主题 自身 的 概率 分 布 。 模 型 的 主题 层 
为 2 和 题 - 词 项 "分 布 ,由 KxM 的 矩阵 B 参数 化 ;文档 
尾 g 刻 画 “ 文 档 - 主题 "分 布 ,由 参数 a 确定 ; 词 项 层 z 


出 化 算法 ( Expectation Maximization, EM) 和 Gibbs dili 

FESTEM 算法 "基于 连续 迭代 使 极 大 似 然 估计 达到 稳 
定 6 通 过 求解 最 大 似 然 函 数 实现 参数 推断 ,本 研究 的 
LDA 模型 采用 EM 算法 。 


4.1.2 基于 规范 特征 的 主题 模型 

本 研究 选用 LDA 凝练 评论 内 容 , 生 成 基于 主题 的 
特征 描述 框架 。 按 照 主题 建 模 的 常规 做 法 ,一般 提 取 
名 词 和 动词 等 实 词 描 述 文 档 ( 后 表述 为 “名 词 + 动词 
建 模 ”) ;但 后 续 研 究 发 现 基于 实 词 的 聚 类 主题 语义 模 
糊 ,尤其 是 面向 特定 领域 ,于 是 引入 领域 特征 词典 ,只 
取 特 征 词 进 行 聚 类 。 这 一 优化 策略 可 增强 文档 的 主题 
表征 力 ,缩减 特征 空间 维度 ,提高 计算 效率 ,该 方案 被 
命名 为 “特征 词 建 模 ”。 

但 “特征 词 建 模 " 仍 是 基于 独立 词 项 的 建 模 方式 ， 
“屏幕 “触摸 屏 “ 屏 “大 屏 " 等 同义词 均 被 视 为 不 同 
词 项 ,不 能 辨识 词语 间 的 同 义 关 系 。 本 研究 在 “特征 


语义 整合 ,如 某 评 论 的 特征 词 描述 为 d= | 屏 , 大 小 , 彩 
bf ,性价比 ,价格 …| , 规范 后 变 为 d= | 屏幕 ,尺寸 , 屏 
幕 , 价 格 ,价格 …| 。 经 整合 ,文档 表达 升 至 概念 层级 。 
本 文 将 其 命名 为 “ 同 义 特征 词 标 化 ” 建 模 。 

研究 设计 实验 对 比 “ 名 词 + 动词", “特征 词 ”和 
“ 同 义 特 征 词 标 化 ”3 种 建 模 方案 的 应 用 效果 ,选择 最 
优 方 案 作为 评论 和 用 户 模 型 的 描述 框架 。 
4.2. 主题 空间 下 的 评论 及 用 户 模 型 构建 
4.2.1 评论 模型 

LDA 主题 建 模 过 程 中 ,同步 得 到 “文档 -主题 ” 概 
率 分 布 和 矩阵 ,我 们 将 9 表示 成 Review_MAX;, ,I 对 应 
评论 语 料 集 的 文档 数 ,K A ERZ Review MAX, „AY 
行 向 量 即 为 评论 + 在 主题 空间 下 的 概率 分 布 描述 ,如 
公式 1: 


r. topic, profile = [ p, ,p, ,p, | 公式 (1) 
4.2.2 用户 兴 趣 模 型 

用 户 模 型 同样 建立 在 隐 和 主题 空间 上 。 为 此 , 先 设 
定 一 组 描述 用 户 兴趣 的 产品 特征 词 Interest_set, 用 户 
从 中 选择 其 关注 的 词 项 ,算法 将 其 选择 的 词 项 序列 映 
射 至 隐 主 题 空间 。 建 模 过 程 分 3 步 : 

步 又 1: 设 定 Interest. set ,根据 用 户 选 择 生成 基于 
特征 词 的 用 户 兴趣 描述 。 

根据 LDA 聚 类 结果 ,同时 参照 电 商 平台 对 手机 特 
征 的 分 类 ,将 描述 手机 性 能 的 特征 词 划 分 为 8 个 主题 ， 
分 别 为 “屏幕 效果 、 网 络 信号 、 外 观 设计 、 拍 照 摄 影 、 影 
音 娱乐 .运行 性 能 、 性 价 比 、 电 池 续 航 ”, 用 户 从 中 选择 
其 关注 的 特征 。 如 ,用 户 u 关注 手机 “外 观 ” 和 “电池 
性 能 ”, 则 从 对 应 主题 中 选取 主题 描述 词 表征 u, 有 u. 
feature_profile = | 电池, 续航, 外观, 外表, 屏幕 ,机 身 ， 
大 小 ,…|。 规 范 表达 为 公式 (2)。 其 中 , Topic P) X} 
应 用 户 兴 趣 主题 下 的 主题 词 集 。 将 u. feature. profile 映 
射 至 LDA 隐 主 题 空间 。 

u. feature, profile = |1,11, e Topic (f) ,f e Interest 


set,i=1,2,.…,m| 公式 (2) 

步骤 2: 用 户 兴趣 的 词 向 量 表达 。 

词 向 量 是 基于 浅 层 神经 网 络 学 习 获 得 的 词语 的 一 
种 分 布 式 表达 ,通过 将 词 表 示 成 一 个 N 维 高 密度 实数 
向 量 , 词 项 对 应 了 N 维 空间 中 的 一 点 ,点 的 间距 反映 了 
词 项 间 潜 在 的 语义 关系 。 在 将 基于 特征 词 的 用 户 兴 
映射 至 主题 空间 之 前 ,研究 引入 词 向 量 , 先 将 u feature_ 
profile 转换 为 词 向 量 矩 阵 u. vec MAX, ,, (v 为 词 向 量 维 


词 ” 基 础 上 ,对 同义词 进行 规范 ,“ 触 摸 屏 , 屏 , 大 屏 ” 同 
义 词 等 均 用 "屏幕 " 蔡 换 。 这 相当 于 对 文档 内 容 进行 


LH 


度 ) 。 基 于 词 向 量 描述 的 用 户 兴 趣 模型 可 传达 语义 , 提 
高 推荐 准确 率 。 而 采用 u. vec_MAX, ,矩阵 表示 也 便于 
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将 用 户 模型 映射 至 主题 空间 ,用 户 兴趣 和 评论 模型 基于 
同一 主题 空间 , 即 可 看 作 空 间 中 的 两 点 ,二 者 相关 度 直 
接 用 距离 公式 计算 。 研 究 引 入 的 词 向 量 为 北京 师范 大 
学 的 开源 中 文 预 训练 模型 ”; 。 该 词 向 量 的 训练 语 料 为 
“百度 百科 ”, 语 料 库 规 模 4.1G ,向 量 空间 维度 为 300。 

2p9 3: 主题 空间 下 的 用 户 兴趣 模型 。 

借 由 LDA 聚 类 生成 的 “主题 - 词 项 "概率 分 布 对 
E t 进行 表达 ,如 公式 (3 ) 所 示 : 

t. feature profile = | <f.,w, > ,i=1,2,.…,n) 

公式 (3) 


公式 8, 即 融合 用 户 兴 趣 和 评论 质量 两 方面 要 素 的 推 
荐 策略 ,综合 评价 指标 Combined score 命名 为 “结合 

Combined_score =w,* Pref score + w,, * Helpfulness 
score 公式 (8) 

式 8 中 ,w, 和 wi 分别 为 兴趣 分 和 效用 分 的 权重 ， 
WE w, + wi =1。 具 体 应 用 中 ,两 个 权重 设 为 参数 ,可 
对 融合 推荐 方案 进行 灵活 设置 ,该 方案 也 将 兴趣 推荐 
和 效用 推荐 纳入 同一 框架 。 


5 XS EZ 


为 描述 主题 的 特征 词 ,w, 为 上 的 权重 ,nm 为 特 
征 词 个 数 。 相 应 地 ,建立 主题 t 的 词 向 量 和 矩阵 t vec, 
MAX,,,。 在 词 向 量 空间 下 ,将 u 的 兴趣 矩阵 与 主题 t 的 
转 置 矩 阵 相 乘 ,同时 纳入 主题 特征 词 权重 矩阵 W, = 


[ib 
与 人 的 语义 相关 度 ( 见 公式 4) 。 根 据 公式 4 计算 用 户 
个 主题 的 相关 度 , 生 成 主题 空间 下 的 用 户 兴 
模型 ,如 公式 5 所 示 : 

Sim, = Max ( u. vec. MAV 


x t. vec, MAX,,, x 
AX (4) 
u. topic, profile = [ Sim,, Sim, ,… ,Simx ] 公式 (5) 
融合 用 户 兴趣 的 评论 排名 与 推荐 
ae 在 用 户 模型 和 评论 模型 构建 的 基础 上 ,将 用 户 兴 
要 素 引 入 推荐 模型 。 提 出 三 种 推荐 模式 , 即 基于 用 
POSU 的 推荐 (下 称 “ 兴 趣 推荐 ”) ,基于 评论 感知 效用 
的 稚 荐 (下 称 " 效 用 推荐 ” ) 及 融合 用 户 兴 趣 及 评论 感 
知 歼 用 的 推荐 (下 称 “ 融 合 推荐 " ) 。 
460 ”兴趣 推荐 
基于 内 容 的 文本 信息 推荐 的 本 质 是 计算 内 容 与 用 
户 兴趣 的 相关 度 , 依 相关 度 对 推荐 信息 进行 TopN HF 
序 。 本 研究 用 余弦 距离 测度 二 者 相关 度 , 令 =u. topic 
_profile E =r. topic, profile, 计算 见 公 式 (6) ,. Pref. score 
命名 为 “兴趣 分 ”。 
Pref score =u * r/Clul x IFI) 公式 (6) 
4.3.2 效用 推荐 
效用 推荐 的 排序 指标 直接 采用 基于 网 站 用 户 投 票 
的 评论 感知 效用 值 , 如 公式 (7) 所 示 。Helpfulness_ 
score 后 简称 “效用 分 ”。 


mxv 


Num of helpful votes 


Helpfulness, score = In( Total vot 
al votes 


公式 (7) 
4.3.3 融合 推荐 
融合 方案 将 评论 的 兴趣 分 和 效用 分 同时 纳入 计算 


实验 语 料 源 自 “中 关 村 在 线 ”( http://www. zol. 
com. cn) 。 构 造 LDA 模型 凝聚 语 料 集 中 的 产品 的 关注 
点 ,生成 基于 夷 类 主题 的 资源 描述 框架 , 即 建 立 隐 主 
题 空间 。 用 户 兴趣 通过 开发 数据 采集 平台 获取 ,通过 
问卷 反馈 对 融合 推荐 模式 的 应 用 效果 予以 检验 。 
5.1 数据 与 资源 建设 
5.1.1 评论 数据 及 相关 资源 

语 料 采 集 时 间 为 2018 年 11 月 。 主 要 提取 评论 文 
本 及 评论 的 感知 效用 , 共 14 506 条 评论 。 相 关 资 源 还 
包括 手机 特征 词 表 和 同义词 表 , 两 个 词 表 均 为 前 期 研 
TRR ,特征 词 表 汇总 了 手机 特征 词 301 个 ,同义词 表 
包含 808 个 词 项 。 
5.1.2 ”用户 兴趣 数据 和 评测 数据 

依据 研究 设计 开发 用 户 数 据 采集 和 评测 平台 。 评 
测 页 面 列 出 预先 设 定 的 用 户 兴趣 词 集 , 受 邀 用 户 自主 
选择 关注 的 产品 特征 ,系统 根据 用 户 选择 构建 用 户 模 
型 ,生成 评论 推荐 列表 ,向 受 邀 用 户 进 行 评 论 推 送 ; 受 
邀 用 户 需 针对 不 同方 案 推送 的 评论 进行 评价 ,系统 设 
置 了 信息 适 切 度 和 信息 质量 两 项 指标 。 适 切 度 测度 用 
户 个 性 需求 方面 的 满意 度 ,信息 质量 则 是 用 户 对 评论 
的 内 容 质 量 及 形式 的 满意 度 评价 。 评 价 采 用 五 级 量 
表 , 评 分 越 高 ,满意 度 越 高 。 

课题 组 成 员 通 过 多 种 渠道 发 送 评 测 系统 链接 , 受 
邀 者 通过 链接 进入 系统 ,按照 指引 完成 兴趣 特征 词 选 
TE ,并 对 推送 评论 作 评 价 ,系统 后 台 汇 总 并 分 析 评测 数 
据 。 整 个 评测 实验 历时 一 个 月 (2019 年 11 月 -2019 
年 12 月 ) ,期 间 对 平台 各 项 功能 进行 了 多 次 修正 与 完 
善 ,最 终 获得 有 效用 户 评测 数据 208 份 。 评 测 平 台 的 
界面 截图 见 图 2。 
5.2 ”实验 与 结果 

针对 提出 问题 (参见 3 研究 设计 ) , 共 进 行 三 组 实 
验 。 实 验 1 :主题 建 模 , 从 评论 语 料 中 提炼 产品 特征 主 
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Bos KL(p | q) HER p 分 布 与 主题 q 分 布 的 KL 散 度 ,p 
- (x) J p 中 词 项 的 概率 分 布 。 因 KL 散 度 非 对 称 ,一 般 
取 KL(p | q) fll KLCq || p) B93548 4E 2y p AI q I KL di 
BE, KL 散 度 测度 分 布 差异 , 值 越 大 , 聚 类 区 分 度 越 大 ， 


ey 诸如 揭 像 头 ， 像 素 等 等 关 
的 质量 ， 对 您 了 解 产品 该 特征 的 帮助 程度 


聚 类 结构 越 好 。 
- eana DL KL V4) = p(x)log( ) 公式 (9) 
KL(p,q) _KL(p E 公式 (10) 


图 2 评论 推送 评测 系统 界面 ( 评测 界面 截图 ) 


(2) 模 型 参数 设 定 。 对 于 LDA 模型 ,主题 数 天 的 
题 ,对 比 “ 名 词 + 动词 “特征 词 “ 同 义 特征 词 标 化 "三 取 值 十 分 关键 ,该 参数 与 模型 的 a 和 B 有 关 。 人 研究 将 
种 建 模 方案 的 LDA 聚 类 效果 ,确立 模型 描述 框架 ; 实 | 天 作为 优化 参数 ,通过 实验 确定 取 值 。 图 3 为 3 种 建 
验 2: 用 户 建 模 ,构建 LDA 隐 主 题 空间 下 的 用 户 模型 | 模 方案 取 不 同 K 值 的 聚 类 效果 。 整 体 来 看 , 随 着 天 递 
实验 3 :评论 推荐 ,对 比 “ 兴 趣 "“ 效 用 “融合 ”3 种 推荐 | 增 ,Avg_similarity 呈 下 降 趋势 ,说 明 主 题 间 相似 度 减 
策略 的 实际 效果 ,检验 个 体 要 素 对 评论 感知 价值 的 影 | 少 , 聚 类 结构 稳定 性 增强 。 相 反 ,KL 散 度 渐 增 ,表明 主 
响 刀 2 实验 采用 python 语言 实现 ,使 用 jieba 进行 中 文 预 | 题 间 差 异 拉 大 ,内 部 凝聚 力 增强 。 而 随 着 天 递增 ,两 个 
Kc pl sklearn 的 Latent Dirichlet Allocation 类 进行 指标 逐渐 收敛 。 具 体 到 三 个 建 模 方案 ,两 组 指标 均 显 


LDA tst , SEE n LE] pyLDAvis 实现 。 示 ， 同 义 特 征 词 标 化 "的 聚 类 效果 明显 优 于 “名词 + 
se LDA 主题 建 模 实验 与 结果 动词 ”和 ”特征 词 ”。 说 明 特 征 词典 的 引入 有 效 减少 了 


了 (1) 模型 参数 和 评测 指标 。 为 获取 较 优 模型 , 实 | 噪音 词 干扰 ,而 特征 词 规范 化 进一步 改善 了 矩阵 的 稀 
驴 闻 先 考虑 主题 聚 类 的 评测 指标 和 参数 设置 。 对 于 | 芷 性 ,主题 内 容 得 以 凝练 , 聚 类 模型 质量 最 佳 。 因 此 ， 
Lb. 主题 癌 平 均 相 似 度 最 小 时 ， 聚 类 结构 最 稳定 , 模 后续 实验 采用 “ 同 义 特征 词 标 化 ”的 主题 聚 类 方案 。 
型 蔷 优 。 主 题 的 平均 相似 度 可 用 于 测度 模型 稳定 性 。 ”根据 实验 结果 ( 见 图 4)。 两 个 评测 指标 均 在 K=13 处 
本 研究 用 聚 类 主题 间 余 弦 距 离 的 均值 Avg_similarity 测 | 开始 趋 缓 , KL BUS =8. 267,Avg_similarity = 0. 05 , 最 
度 缚 类 结构 ,该 值 越 小 ,结构 越 稳定 。 另 一 指标 为 三 | 终 确定 玉 =13。 

BIORE ( Kullback-Leibler divergence) ,计算 见 公式 (9) (10)。 


sm 0| vo g*eemdlexyEW | 名 词 + 动 名 词 
c zm 20] -— Ex 
一 一 辐 义 特征 词 标 化 | 0/4 aes nenna 
© 75 
0254 j 
B 704 FÉ 
E 0201 del 
E m 65 
ul EM eque LEER 
8 0.154 M 604 P 
LINZ 
590 Ry MEET 
a T AAE T e r ee EE a a s 
504 
0.054 45 
6 8 10 12 14 16 6 8 10 12 P 16 
K(topies) K(topies) 


3 3 种 特征 建 模 方案 下 的 LDA 主题 聚 类 效果 
( 左 : 纵 坐标 为 Avg_similarity; 右 : 纵 坐标 为 KL 散 度 ) 


(3) 聚 类 结果 。 图 5 Jg K 213 时 ,用 pyLDAvis Æ | 理 :对 每 个 聚 类 主题 , 依 词 项 分 布 概率 从 大 到 小 对 主题 
成 的 主题 聚 类 效果 图 。 整 体 观察 ,各 主题 分 布 均衡 ,大 | 词 排序 , 取 前 8 个 词 项 描述 主题 语义 。 若 某 词 项 同时 
部 分 主题 区 分 明确 ,少数 出 现 交 三 (主题 4 和 5 ,主题 1 | 出 现在 多 个 主题 下 ,将 其 归属 权 值 最 高 的 聚 类 主题 。 
和 2)。 交 谷 易 导致 主题 语义 模糊 ,为 此 进行 如 下 处 | 如 ， 电 池 容 量 " 均 出 现在 主题 4 和 主题 12 中 ,但 在 主 
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4 RAKET LDA 主题 聚 类 效果 
(Avg_similarity 和 KL 散 度 ) 


题 49 下 的 权 值 (0.052) 高 于 主题 4 下 的 权 值 (0.019)， 
MILF veda 12 下 。 取 类 主题 词 经 调整 ,可 更 好 地 明 
叮 旨 题 含 义 。 根 据 各 主题 的 主题 词 列表 ,参考 数码 网 
xor 村 征 指标 的 设置 ,13 个 主题 分 别 对 应 到 “运行 
性 酌 . 屏 幕 效果 .网 络 信 号 .外 观 设计 .拍照 摄影 .影音 娱 
乐 < 性 价 比 . 电 池 续 航 、 其 他 ”9 个 特征 类 下 , 据 此 生成 用 
PS 六 专 选择 特征 词 集 Interest_set ,用 于 用 户 建 模 。 


N Intertopic Distance Map (via multidimensional scaling) 
e 
N i 
LE] 4 1 3 
> 5 
z( 
9 
E 
12 
LT d 10 
Ka 7 
© 1 


1 
Marginal topic distribution - 


5 K-13 时 的 LDA 主题 可 视 化 效果 


5.2.2 用户 兴趣 建 模 实验 

采用 4.2.2 的 方法 ,用 户 从 Interest_set 中 选择 感 
兴趣 的 产品 特征 词 ,算法 根据 用 户 选 择 先生 成 u. fea- 
ture. profile, 继而 将 u. feature. profile 映射 至 主题 空间 
下 ,生成 u. topic_profile。 表 1 为 用 户 建 模 示 例 , 设 用 户 
从 Interest_set 选择 了 “屏幕 效果 ”和 “外 观 设计 ” ,根据 
主题 词 映 射 ,生成 u. feature_profile = {外观 , 外 表 , 屏 
幕 ,机 号 ,大 小 ,色彩 ,边框 ,… 上 ,继而 引入 词 向 量 生成 


u 在 主题 空间 下 的 模型 u. topic_profile。 表 1 rz ,将 

特征 词 序列 的 用 户 模型 映射 至 主题 空间 ,相当 于 对 描 

述 用 户 兴 趣 的 特征 词 进行 语义 扩展 ,用 户 信息 需求 表达 

更 完善 ,能够 匹配 到 更 多 与 用 户 兴 趣 相关 的 评论 ,提升 

查 全 率 。 该 模型 的 推荐 效果 在 后 续 实 验 中 得 以 检验 。 
表 1 用 户 u 在 隐 主 题 空 间 下 的 兴趣 表征 ( 示例) 


主题 


主题 描述 (排名 前 8 的 主题 词 , 依 权重 排序 ) iia 
1 手机 屏幕 外 表 发 热 使 用 效果 游戏 东西 0.465 
2 优点 时 间 客服 待机 网 络 上 网 通话 网 束 0.283 
3 。 屏幕 外表 机 身 边框 大 小 色彩 金属 手感 0.733 
4 — 像素 相机 DRE 前 置 拍照 后 置 内 在 电池 容量 0.485 
5 。 手机 拍照 效果 照片 外 观 充电 器 指纹 自拍 0.465 
6 JER 通话 音乐 耳机 拍照 效果 外 放 游戏 0.324 
7 。 充电 器 速度 运行 内 存 指纹 发 热 无 线 软件 0.455 
8 配件 品质 产品 处 理 器 品牌 国产 机 性 价 比 样子 0.329 
9 价钱 外 观 性 能 配件 屏幕 性 价 比 手感 定位 0.347 
10 电池 续航 外 观 能 力 性 价 比 待机 使 用 做 工 0.434 
Lo 系统 硬件 流畅 en 实用 性 体验 下 载 软件 0.279 
12 。 流畅 运行 手感 外 观 续航 系统 电池 容量 像素 0.358 
13 反应 指纹 关机 死机 图 片 设置 重启 黑屏 0.191 


5.2.3 融合 用 户 兴 趣 的 评论 推荐 实验 

(1) 评 论 排 名 序列 差异 分 析 。 实 验 首 先 对 3 种 推 
荐 模式 下 评论 排名 进行 差异 性 分 析 。 设 定 用 户 选 择 的 
兴趣 特征 词 (如 “屏幕 效果 ”) ,基于 该 兴趣 词 ,分 别 采 
用 3 种 推荐 模式 针对 4 款 手机 评论 进行 排名 ,就 每 款 
产品 评论 的 3 个 排名 序列 进行 Friedman 检验 ,如 表 2 
所 示 。 结 果 显 示 , 对 于 3 种 推荐 模式 ,各 产品 数据 的 
Friedman 统计 量 的 概率 p 均 小 于 0.05, 可 认为 3 种 模 
式 下 的 评论 排名 存在 显著 差异 , 即 相同 兴趣 词 下 ,3 种 
推荐 方案 下 的 评论 有 不 同 的 排序 结果 。 根 据 平 均 秩 ， 
除 产品 C 的 评论 , 兼 具 用 户 个 体 要 素 和 评论 质量 的 
“融合 排名 ”模式 与 仅 考 量 评论 质量 “效用 排名 ”模式 
的 差异 明显 ,说明 用 户 个 体 的 兴趣 偏好 对 评论 感知 价 
值 具有 一 定 影响 力 。 

表 2 3 种 推荐 策略 下 评论 推荐 排名 的 Friedman 检验 
(用户 兴趣 特征 词 “ 屏幕 效果 ”) 


产品 A B C D 
(IPhoneX) (OPPOR9) (GalaxyS7) (Matel0) 

评论 量 167 1711 1035 74 
基于 兴趣 排名 的 平均 秩 1.921 1. 833 1. 660 1.923 
基于 效用 排名 的 平均 秩 1. 893 1.947 2.175 1. 802 
基于 融合 排名 的 平均 秩 2. 192 2.231 2.172 2.286 
Friedman 统计 量 9.372 147.5 181.246 9.130 
渐进 显著 性 p .009 **  .000**  .000**  .010** 


DE: ES p «0.1; "Xon p «0.05; 


"ak p < 0.01 
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实验 进一步 检验 不 同 兴 趣 特征 词 下 ,评论 推荐 排 
名 的 差异 。 换 言 之 ,验证 兴趣 推荐 策略 能 否 满足 个 性 
化 的 信息 需求 ,不 同 兴趣 偏好 的 用 户 能 否 绑 得 不 同 推 
荐 。 实 验 主要 考量 兴趣 推荐 和 融合 推荐 两 个 方案 ,分 
别 检 测 8 个 独立 的 兴趣 特征 词 。 检 验 结果 显示 ( 见 表 
3) ,对 于 不 同 的 兴趣 词 ,两 个 推荐 模式 的 Friedman 检 


验 的 显著 性 概率 指标 p 均 小 于 0.05 ,可 认为 针对 不 同 
兴趣 的 用 户 ,评论 推荐 排名 存在 显著 差异 。 即 不 同 兴 
趣 偏好 ,会 产生 不 同 的 推送 结果 。 评 论 排序 过 程 中 ,个 
体 要 素 产 生 了 一 定 作 用 ,引入 用 户 兴 趣 的 推送 随 用 户 
兴趣 变化 而 不 同 。 后 续 实验 将 对 不 同 推荐 模式 的 用 户 
满意 度 做 评测 ,评价 结果 可 反映 用 户 要 素 的 影响 力 。 


RI 不 同 兴趣 点 下 评论 排名 的 Friedman 检验 ( 以 OPPOR9 为 例 ,样本 量 1711 ) 


— 基于 不 同 兴 趣 特征 词 的 排名 列表 的 秩 均值 Friedman PERY 
屏幕 效果 ”网 络 信 号 ”外观 设计 拍照 摄影 。 影音 娱乐 。 运行 性 能 。” 性价比 电池 续航 统计 量 P 

兴趣 推荐 4.600 4.091 4.201 3.933 4.224 4.927 5.125 4.936 405.610 .000 * 

融合 推荐 4.723 4.123 4.128 4.394 3.847 5.098 4.725 5.002 410.37 .000 * 


注 : 表示 p<0.1; “表示 p<0.05; “表示 p < 0.01 


(2)3 种 推荐 策略 的 用 户 满意 度 分 析 。 依 照 5.1.2 
建 评测 平台 ( 见 图 2) ,发 链接 邀请 用 户 参 与 实验 。 
受 斑 者 在 产品 匿名 情况 下 选择 感 兴趣 的 产品 特征 词 ， 
亚 命 依 其 选择 推送 一 组 评论 ,为 确保 数据 质量 ,每 一 推 
t tbt Bt e 实验 将 排名 1.4、7 
的 澡 论 进行 推送 ) 。 同 时 ,为 屏蔽 评论 长 度 对 评论 感知 
效 寺 的 影响 ,推送 评论 长 度 控制 在 30 - 460 个 字符 区 
过 评测 者 阅读 评论 后 ,对 其 适 切 度 和 质量 评分 并 提 
交 请 测 结果 。 实 验 用 于 检验 用 户 个 体 要 素 对 评论 感知 
效用 的 影响 ,预期 结果 是 :融入 用 户 兴趣 要 素 的 推荐 方 
案 的 满意 度 将 高 于 单纯 的 “效用 推荐 "方案 “融合 失 
荐 因 同 时 考虑 了 信息 质量 ,用 户 总 体 满意 度 最 高 。 用 

平分 数据 的 统计 结果 如 图 6 所 示 : 
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户 感知 满意 度 评分 (> 


评论 信息 适 切 度 


评论 信息 质量 
评测 指标 


6 3 种 推荐 方案 的 用 户 满意 度 评价 


如 图 6 rz ,对 于 信息 适 切 度 , 即 在 满足 用 户 信息 
需求 方面 “融合 推荐 " 获 最 高 分 ; 对 于 信息 质量 ， 融 
合 推荐 "评分 与 “效用 推荐 ”基本 相当 ,该 推荐 模式 依 
然 可 确保 推送 评论 的 质量 。 进 一 步 作 均值 差异 显著 性 
检验 ,结果 显示 ( 见 表 4) ,信息 适 切 度 方面 “融合 推 
荐 ”与 “效用 推荐 ”的 评价 存在 显著 差异 (t= -0.084,p 


«0.95) ,与 “兴趣 推荐 ”的 评价 也 存在 显著 差异 (t= 
-2.228,p «0.05) ,验证 了 “融合 推荐 ”方案 在 满足 用 
户 信息 需求 方面 的 有 效 性 。 

评论 质量 的 检验 结果 显示 ( 见 表 5) “融合 推荐 "与 
“兴趣 推荐 "方案 的 评价 存在 显著 差异 (t = -2.263 4, 
p<0.05),“ 融 合 推荐 "与 “效用 推荐 " 的 差异 不 显著 。 
进一步 说 明 ，“ 融 合 推荐 "策略 在 信息 质量 方面 表现 较 
优 ,达到 “效用 推荐 "方案 同样 的 效果 。 但 单纯 基于 
“兴趣 ”的 推荐 若 不 考虑 信息 质量 ,推荐 效果 有 限 。 

(3) 推荐 效果 实例 分 析 。 综 合 上 述 实 验 结果 ,对 
评分 最 高 的 “融合 推荐 ”方案 进行 重点 分 析 。 信 息 适 
切 度 方面 ,“ 融 合 推荐 " 较 “ 效 用 推荐 ”的 用 户 评分 有 显 
著 提 升 (3. 149 一 3.377)。 原 因 在 于 “融合 推荐 "考虑 
了 用 户 兴 趣 特征 的 语义 匹配 ,这 类 评论 中 用 户 感 兴趣 
的 产品 特征 的 评价 内 容 更 多 ,提升 了 信息 的 适 切 度 。 
相 较 "兴趣 推荐 ”,“ 融 合 推荐 " 则 因 有 效 过 滤 了 兴趣 
特征 提 及 率 高 但 信息 量 过 少 的 评论 ,一 定 程 度 上 保障 
了 信息 质量 ,因而 在 三 个 推荐 方案 中 表现 最 佳 。 推 荐 
实例 见 表 6、 表 7、 表 8。 

以 表 6 为 例 ,用 户 选 择 “ 屏幕 效果 ”为 兴趣 词 ， 效 
用 推荐 ”推送 的 评论 中 ,没有 “屏幕 特征 ”的 相关 描述 ; 
“兴趣 推荐 " 推送 的 评论 中 ,出 现 了 “屏幕 “大 小 ”6 
寸 " 等 相关 特征 ,该 评论 有 和 较 高 适 切 度 ,但 因 内 容 
质量 评价 并 不 高 ,信息 量 是 影响 评论 感知 效用 的 重要 
因素 ”融合 推荐 "推送 的 评论 考虑 了 质量 因素 ,强调 
了 相关 兴趣 特征 的 提 及 率 , 表 6、 表 7 实例 均 显示 ,该 方 
案 推 送 的 评论 在 内 容 丰富 度 和 满足 个 性 化 信息 需求 两 
方面 都 优 于 前 二 者 。 对 于 评论 质量 ,“ 融合 推荐 ” 较 
“兴趣 推荐 "方案 推送 的 评论 质量 评分 有 显著 提升 
(2.9923. 139) ,原因 在 于 “融合 推荐 "剔除 了 信息 量 
少 效用 低 的 评论 ,保障 了 推送 信息 的 质量 。 
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表 4 3 种 推荐 方案 下 的 评论 适 切 度 用 户 评分 差异 t 检验 
BOXE i - 
配对 样本 t 自由 度 Sig. 
平均 值 标准 偏差 标准 误差 平均 值 
适 切 度 ”效用 推荐 v 兴趣 推荐 -0.077 0.979 0. 068 -1.133 207 0.258 
效用 推荐 v 融合 推荐 -0.228 0. 804 0. 056 -4.084 207 0. 000 *** 
兴趣 推荐 v 融合 推荐 -0.151 0.975 0. 068 -2.228 207 0.027 ** 


HE: “表示 p «0.05; "m p «0.01 


X5 3 种 推荐 方案 下 的 评论 质量 满意 度 评分 差异 t 检验 
配对 差 值 
配对 样本 一 — - 1 自由 度 Sig 
平均 值 标准 偏差 标准 误差 平均 值 
评论 质量 效用 推荐 v 兴趣 推荐 0.123 0.992 0. 069 1.793 207 0.074 
效用 推荐 v 融合 推荐 一 0.024 0.762 0. 053 -0.455 207 0.65 
兴趣 推荐 v 融合 推荐 —0. 147 0.940 0.065 — 2. 263 207 0.025 x x 


dE: “表示 p «0.05; “表示 p «0.01 


> 


表 6 产品 D 3 种 排名 方案 的 排名 No. 1 评论 对 比分 析 ( 实例 ) 


Coat 效用 推荐 兴趣 推荐 融合 推荐 

COBEXUR 配置 杠 杠 的 ,就 是 meta9 才 出 来 ”mate10 好 ,功能 强大 。 特 别 是 ”续航 好 音质 不 好 居然 得 抢 说 了 些 有 的 没 的 就 来 说 说 手机 吧 , 尺 二 
O 已 经 那么 贵 了 , metalo 的 价格 ”屏幕 大 小 合适 ,我 用 mate7 是 6 和 我 现在 用 的 P9 比 起 来 稍微 大 上 一 小 圈 , 但 是 屏幕 毕竟 大 了 近 1 
e 个 计 更 离谱 寸 的 ,用 了 多 年 , 正 合适 寸 , 还 是 很 震撼 的 。 握 在 手 里 也 觉得 差不多 , Eb MATE9 要 小 一 点 。 


屏幕 和 M9 都 是 2K 的 ,显示 很 细腻 …. 


于 一 S 


z X7 产品 B 3 种 排名 方案 的 排名 No.1 评论 对 比分 析 ( 实例) 


Ogei 效用 推荐 兴趣 推荐 融合 推荐 

CSE 能 Baa BELL KATIN 电池 容量 大 ,外 观 潭 亮 ,续航 出 。 屏幕 大 ,外 观 漂亮 ,电池 容量 大 ,屏幕 效 果 好 ,系统 强悍 ,机 身 内 存 
N 太 大 了 !11! 只 能 当 平板 用 !11! 。” 色 价格 高 ,性 价 比 低 ,游戏 运行 ”大 ,续航 出 色 , 分 状 率 高 ,处 理 器 不 错 ,运行 流畅 价格 高 ,相机 像素 
> KERM ,续航 一 般 ,音质 一 般 ,分 辨 率 低 ,成 像 效 果 差 ,摄像 效果 一 般 , 性 
Kad 价 比 低 ,游戏 运行 不 够 流畅 。 


表 8 


产品 A 3 种 排名 方案 的 排名 No.3 评论 对 比分 析 ( 实例 ) 


趣 特征 词 效用 推荐 兴趣 推荐 融合 推荐 
JBERUBUR 期待 是 i0S 11 + 苹果 All + 亮 铜 色 + 全 面 屏 苹 果 在 我 上面 的 缺口 明显 影响 屏 ”便宜 了 将 近 3000 块 啊 ! 冲 新 全 套 配件 银色 国 行 256G 
Q 心里 是 比较 完美 的 ,希望 有 双 卡 版 苹果 iPhone X 难道 ” 幕 的 整体 性 ,这 样 的 全 屏 ” 大 内 存在 保修 359 REE 7799 入 手 主屏 尺寸 5.8 英寸 
不 是 之 前 曝光 的 苹果 8 ,会 不 会 还 有 新 款 啊 , 不 知道 会 ”还 不 如 不 是 ;缺乏 美感 主屏 材质 OLED, Multi-Touch 显示 屏 主屏 分 辨 率 
不 会 还 有 新 的 配色 ,比如 我 喜欢 的 草绿 色 , 粉 色 , 真 心 希 2436x1125 像素 屏幕 像素 密度 463ppi 罕 边 框 4. 57mm 


望 价 格 不 要 太 高 ,要 不 俺 只 能 当 吃 瓜 群众 坐 小 板 莞 上 看 
看 发 布 会 过 过 瘾 了 ,如 果 性 价 比 高 的 话 一 定 信 手 一 台 ， 
毕竟 等 了 一 年 了 。 


表 7、 表 8 均 显 示 ,“ 融 合 推荐 "推送 的 评论 的 内 容 
gi" 兴趣 推荐 "方案 推送 的 评论 更 丰富 ,能 更 好 地 帮助 
用 户 了 解 产 品 ,消除 决策 中 的 不 确定 性 ,对 用 户 感知 信 
息 价 值 产 生 了 积极 影响 。 综 合 其 在 适 切 度 上 的 表现 ， 
“融合 推荐 ”推送 的 评论 既 有 较 高 的 信息 质量 ,又 可 满 
足 用 户 的 个 性 化 信息 需求 。 本 文 的 研究 假设 得 以 验 
证 。 


6.1 研究 结论 
本 文 探究 以 信息 推荐 方式 解决 评论 信息 过 载 的 有 


屏幕 占 比 81. 1596 实话 实说 ,可 以 选择 。 


效 方案 。 研 究 采 用 概率 主题 模型 ,构建 主题 空间 下 的 
用 户 兴趣 模型 ,并 将 其 纳入 评论 感知 价值 计算 模型 , 基 
于 该 模型 提出 融合 用 户 兴 趣 和 评论 效用 的 评论 推荐 策 
略 ,通过 在 线 评测 系统 ,检验 推荐 策略 的 实效 。 整 个 研 
究 围绕 评论 信息 个 性 化 推荐 展开 ,研究 贡献 主要 体现 
在 4 个 方面 : 

(1) 本 研究 构建 了 描述 评论 资源 和 用 户 兴趣 的 主 
题 模型 。 建 模 算法 引入 领域 特征 词典 和 特征 同义词 
典 ,采用 标 化 后 的 评论 特征 词 来 描述 评论 文档 ,这 一 优 
化 策略 整合 了 同义词 项 ,降低 了 文档 特征 维度 ,改善 了 
和 矩阵 的 稀 玻 性 ,生成 的 主题 模型 解释 度 好 ,结构 稳定 ， 
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被 较 好 地 用 于 评论 和 用 户 兴 趣 建 模 。 
(2) 本 研究 在 语义 层面 构建 用 户 兴 趣 模型 。 用 户 


但 测试 过 程 中 发 现 ,用 户 对 产品 性 能 的 关注 有 侧重 
续 研 究 可 对 描述 用 户 兴 趣 的 特征 词 设 定 权重 ， vns 


建 模 引 入 了 词 向 量 ,对 基于 特征 词 序列 用 户 模型 进行 

语义 表征 ,继而 通过 矩阵 运算 ,将 基于 语义 表征 的 用 户 
模型 映射 至 主题 空间 下 。 该 建 模 方案 将 用 户 兴趣 表达 
提升 至 语义 空间 。 

(3) 本 研究 将 用 户 个 性 化 要 素 引入 评论 评价 机 
制 ,提出 融合 用 户 兴 趣 和 评论 效用 的 评论 推荐 策略 。 
基于 用 户 模 型 和 评论 模型 ,通过 语义 计算 ,面向 用 户 预 
测评 论 兴 趣 得 分 ,同时 引入 测度 评论 质量 的 评论 感知 
效用 。 融 合 评论 的 兴趣 得 分 和 效用 得 分 ,提出 两 要 素 

共同 作用 下 的 评论 排名 与 推荐 策略 。 

(4) 本 研究 开发 平台 对 推荐 效果 进行 评测 ,对 比 
分 析 “兴趣 推荐 "“ 效 用 推荐 "和 “融合 推荐 "3 个 方案 
TE 户 对 推送 评论 的 评价 。 结 果品 示 ,“ 兴 趣 推荐 " 方 
案 砚 较 好 地 实现 评论 的 个 性 化 推荐 “融合 推荐 "方案 
奉 售 障 信 息 质量 的 同时 ,能 够 满足 用 户 的 个 性 化 信息 
完 R, 综 合 表现 最 优 。 这 说 明 ,评论 信息 质量 和 用 户 的 

全 称 化 信息 需求 ,共同 作用 于 用 户 对 评论 资讯 的 感知 
请 一 度 ,本 文 所 提出 的 评论 推荐 策略 ,实现 了 一 者 的 有 

ipo ,从 信息 服务 的 视角 来 看 , “融合 推荐 "无 疑 是 
CDM VERE HERE GA. 
N 实践 启示 

.过 基于 评论 感知 效用 的 评论 排名 推荐 从 用 户 群 体感 
向 生发, 并 没有 关注 到 用 户 个 体 的 信息 需求 。 本 研究 
验 跑 了 用 户 个 体 化 要 素 对 评论 感 感知 价值 存在 的 显著 影 
Wir, Jer T Ro HEP HB ECHTE RE. CUT 
SEU BI REI e E EE HE PER HE ERN 
系 , 为 企业 监控 和 有 效 利用 网 络 信息 提供 理论 借鉴 和 
d san 

论 感知 价值 的 显著 作用 ,采用 融合 用 户 兴 趣 的 信息 # 
荐 方式 ,构建 基于 用 户 需求 并 保证 信息 质 et 
滤 体 系 , 优 化 信息 服务 模式 。@ 面 对 目标 用 户 ,商家 簿 
选 兼 具 评论 感知 效用 且 满足 其 信息 需求 的 评论 予以 呈 
现 ,能 够 提升 用 户 的 信息 采纳 率 , 促 其 产生 购买 行为 ， 
从 而 对 商业 运作 产生 积极 影响 。@ 对 于 评论 信息 服务 
及 其 他 领域 的 资讯 服务 平台 ,引入 检索 机 制 获取 用 户 
信息 需求 ,构建 完整 的 资讯 推荐 系统 ,做 到 信息 推荐 精 
准 化 ,可 有 效 缓解 信息 过 载 带 来 的 困扰 ,提升 信息 服务 
品质 ,促进 信息 服务 社区 的 良性 发 展 。 
6.3 研究 局 限 与 进一步 思 

本 研究 对 建 模 和 推荐 方案 设计 得 较 简单 。 如 ,对 
于 用 户 模型 ,表征 用 户 兴 趣 的 特征 词 采用 等 权重 处 理 ， 


精细 的 用 户 兴趣 模型 。 同 样 ,融合 推荐 方案 中 ,评论 
a E 
果 发 现 不 同 权重 设置 下 的 推荐 结果 存在 较 大 差异 , 且 
不 同类 型 的 评论 ,两 个 因素 的 影响 力也 不 尽 相同 ,对 这 
一 问题 , 需 采 集 更 多 类 型 的 语 料 , 作 进 一 步 探 讨 。 后 续 
研究 也 准备 引入 深度 学 习 算 法 ,对 用 户 建 模 进行 深入 
探索 ,从 用 户 评 论 中 提取 用 户 特征 ,完善 个 性 化 推荐 算 
法 。 
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Abstract: | Purpose/significance | In the Web2. 0 era, the quality of online reviews is uneven and overloaded ; 
the cognitive cost of getting valuable content from them is increasing. In the paper, we proposed a review recommen- 
dation ranking scheme which focuses on the information quality of reviews and emphasizes more on the satisfaction of 
users' personal information needs. | Method/process | The probabilistic topic model was adopted in this study, us- 
er-profile and review model based on the topic model were generated by employing the Word2 Vector. By incorporating 
them into review helpfulness evaluation system, the comment recommendation which integrates user interest and com- 
ment quality was realized. The models and related methods were tested and evaluated by a serial of systematic experi- 
ments. | Result/conclusion | The results indicate that both information quality and individual information interests 
are of influence on review perceived helpfulness. The "combining-specific" recommendation strategy , integrating the 
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two factors effectively, performs better than the "interest-specific" and the "utility-specific" recommendation meth- 


od. From the perspective of information service, the "combining" strategy should be with the high-priority for review 
recommendation. 
user-profile modeling on-line reviews 
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